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Development of a Short Version of the Health Literacy Scale 
Short-Form:Based on Classical Test Theory and Item Response 


Theory 


Abstract: 
[Objective] Simplify health literacy scales and conduct psychometric tests in Chinese cohorts. 


[Methods] A total of 7449 residents were included in the evaluation of the scale, and the data 
were randomly generated into 2 data sets for descriptive analysis, validation factor analysis, 
application of classical measurement theory (CTT) and Mokken model in item response theory 
(IRT) for entry screening, and validation analysis of the streamlined scale for reliability and 
validity, etc. 


[Results] A 9-item version of the scale (HLS-SF9) and a 4-item version of the scale (HLS-SF4) 
were simplified using CTT and the Mokken model, respectively.The Cronbach' s a coefficients 
of HLS-SF9 and HLS-SF4 were 0.913 and 0.842, HLS-SF4 was tested for one common factor by 
exploratory factor analysis(EFA), and the results of the confirmatory factor analysis(CFA) of 
HLS-SF9 showed that all the fitness indicators of its three-dimension model were excellent. And 
there was a significant positive correlation between the Perceived Social Support Scale and the 
Family Health Scale Short-Form as the calibration scale (r=0.367, p«0.001;7—0.340, p«0.001 ) 
(770.292, p«0.001; r=0.237, p«0.001), indicating good empirical validity. At the same time, 
HLS-SF9 and HLS-SFA are highly consistent with the content measured by the original version of 
the scale. 


[Conclusions| The simplified Health Literacy Scales have good reliability and validity, and are 
reliable and effective tools for quickly assessing the health literacy of Chinese people. 


Keywords: Health Literacy Scale Simplification Classical Test Theory Mokken Model 


健康 素养 系 个 体 获 取 、 理 解 健康 信息 以 保障 、 推 进 自身 健康 建设 的 能 力 凹 。 
世界 卫生 组 织 强 调 ， 健 康 素养 作为 一 种 认 知 能 力 和 社会 技能 水 平 的 象征 六， 是 健 
TERI SEE UAE DL RR, 健康 素养 水 平 的 限制 易 让 公众 难以 完整 地 认识 、 了 解 疾病 ， 
难以 实现 对 医疗 资源 的 高 效 、 充 分 利用 , 特别 是 影响 慢性 病 患 者 的 自我 疾病 管理 ， 
从 而 存在 较 差 的 服药 依从 性 ， 甚 至 增加 住院 率 与 死亡 率 &9。 我 国 《“ 健 康 中 国 
2030” 规 划 纲 要 》 强 调 居 民 的 健康 素养 情况 是 战略 目标 的 核心 内 容 。 提 升 健康 素 
养 水 平 应 成 为 健康 教育 、 患 者 管理 和 健康 促进 等 方面 的 重要 构成 中 ,这 就 要 求 个 
人 要 充分 了 解 并 使 用 健康 信息 ， 以 便 充分 管理 自身 的 健康 问题 ， 降 低 社 会 成 本 。 
因此 ， 一 个 能 客观 、 全 面 且 准 确 测评 健康 素养 的 工具 是 开展 此 类 研究 的 前 提 。 


随 着 健康 素养 领域 得 到 国内 外 学 者 的 关注 , 用 于 测量 公众 的 健康 素养 工具 研 
发 活跃 ,目前 常用 成 人 功能 健康 素养 测试 (test of functional health literacy in adult, 


TOFHLAO 、 欧 洲 健 康 素养 调查 Cthe European health literacy survey questionnaire, 
HLS-EU-Q) 等 问卷 B9]。 结 合 以 上 研究 ，Tuyen V. Duong 在 HLS-EU-Q47 的 基础 
上 ,编制 了 适用 于 评估 亚洲 国家 公众 健康 素养 的 12 条 目 健康 素养 量 表 (short-form 
health literacy survey questionnaire, HLS-SF12 ) ， 以 良好 的 信 效 度 支 持 了 
HLS-EU-Q47 的 原始 架构 [191。 我 国学 者 多 使 用 国家 卫 健 委 制 定 的 “全 国 居民 健康 
素养 监测 调查 问卷 ”， 随 着 对 健康 素养 研究 的 深入 ,陆续 有 学 者 研发 了 针对 特殊 
人 群 的 健康 素养 评估 工具 01-131。 


目前 课题 研究 中 多 倾向 于 多 维度 、 多 条 目的 测评 工具 , 力争 全 面 化 评估 受 测 
者 的 临床 或 心理 特质 ,但 随 之 应 用 ， 宛 长 的 工具 也 出 现 了 一 定 的 不 足 与 缺陷 : 问 
卷 中 题目 过 多 ,使 得 受 访 者 作答 时 间 较 长 ， 作 答 耐 心 降低 ， 作 答 认 真 度 下 降 ， 问 
卷 的 真实 性 可 靠 性 难以 保障 ; 同时 易 使 受 访 者 产生 隐私 受 侵 的 心理 , 增加 受 访 者 
的 心理 负担 鸣 。 而 简短 版 量 表 则 能 较 大 程度 上 的 规避 以 上 次 端 , 同时 缩减 问卷 填 
写 时间 , 利于 推广 受 访 人 群 与 应 用 领域 。 此 外 ,简短 的 健康 素养 评估 工具 可 被 纳 
入 患者 就 诊 评 估 等 评估 问卷 , 快速 筛 查 出 健康 素养 有 限 的 群体 ,便于 实施 针对 性 
的 健康 教育 ， 评 佑 干预 效果 [8905。 


考虑 到 我 国 在 健康 素养 领域 缺失 简便 的 测评 工具 ， 本 研究 尝试 对 12 条 目 健 
康 素养 量 表 进 行 简化 研究 , 这 将 有 助 于 在 更 大 规模 的 人 群 或 临床 环境 中 对 健康 素 
养 进 行 简单 而 准确 的 评估 ， 为 今后 的 干预 研究 提供 参考 依据 。 


1 对 象 与 方法 
1.1 受 测 对 象 


F 2021 Œ 7 H 10 H-2021 € 9 H 15 日 开展 此 次 调查 , 采用 多 阶段 抽样 的 方 
法 ， 将 中 国 23 个 省 和 5 个 自治 区 的 省 会 、4 个 直辖 市 直接 纳入 ， 并 用 随机 数 表 
法 在 每 个 省 、 自 治 区 的 非 省 会 地 级 行政 区 中 各 抽取 2-6 个 城市 ， 共 120 个 城市 。 
每 个 城市 至 少 招募 1 位 调查 员 或 1 支 调查 团队 。 调 查 员 需 基于 “2021 年 第 七 次 
全 国人 口 普查 结果 ”的 数据 结果 ,使 所 获得 样本 的 性 别 、 年 龄 、 城 乡 分 布 基本 符 
合 人 口 特征 。 纳 入 标准 为 :年龄 三 12 岁 ; 名 具有 中 华人 民 共 和 国 国 籍 ，@ 中 
国 常住 人 口 〈 年 外 出 时 间 志 1 个 月 ) ;四 自愿 参加 研究 ， 填 写 知 情 同 意 书 ，@@ 可 
自行 完成 网 络 问卷 调查 或 在 调查 员 帮 助 下 完成 问卷 调查 ; 9 了 解 问卷 每 个 条 目 所 
表达 的 含义 。 排 除 标准 : @ 神 志 不 清 、 精 神 异 常 者 ; @@ 正 在 参加 其 他 类 似 研 究 课 
题 者 ; @@ 不 愿 合作 者 。 问 卷 回 收 后 由 两 人 背靠背 进行 逻辑 检查 和 数据 筛选 。 本 研 
究 己 通过 伦理 审查 (JNUKY-2021-018) 。 调 查 居民 共 11668 例 ， 回 收 有 效 问卷 
11031 份 ， 问 卷 有 效率 为 94.$4%。 从 “中 国家 庭 健康 指数 调查 ”数据 中 选择 18 
岁 及 以 上 人 和 群 作为 本 研究 的 受 测 对 象 ， 最 终 纳入 7449 份 数 据 ， 并 随机 分 成 两 个 
样本 集 ， 其 中 样本 集 1 共 3680 份 ， 样 本 集 2 共 3769 份 。 


1.2 研究 工具 
1.2.1 一 般 资料 问卷 


由 研究 者 编制 ， 内 容 包括 调查 对 象 的 性 别 、 年 龄 、 民 族 、 户 口 类 型 、 居 住地 
类 型 、 最 高 学 历 情况 、 婚 姻 状 况 、 家 庭 人 均 月 收入 等 。 


1.2.2 健康 素养 简 表 


Tuyen V. Duong 等 编制 09 的 适用 于 公众 健康 素养 测量 的 HLS-SF12 分 为 3 个 
维度 ， 分 别 是 卫生 保健 、 疾 病 预防 、 健 康 促 进 ， 量 表 共 12 个 条 目 ， 采 用 4 级 评 
分 (1= 非 常 困 难 ，2= 困 难 ，3= 容 易 ，4= 非 常 容易 ) ， 使 用 公式 计算 标准 化 HL 
指数 ， 指 数 范围 为 0~50， 指 数 越 高 代表 健康 素养 水 平 越 高 。 计 算 公式 为 ， 指 数 = 
(平均 值 -1) x (50/3) ， 其 中 平均 值 是 每 个 个 体 所 有 参与 项 目的 平均 值 ，1 是 
平均 值 的 最 小 可 能 值 (此 时 指数 的 最 小 值 为 0) ，3 是 平均 值 的 范围 ，50 是 指数 
HEKE. Tuyen V. Duong 报告 健康 素养 简 表 的 Cronbach's a 0.70, ^E fii 
分 量 表 的 Cronbach’ sa 系数 为 0.49~0.72， 疾 病 预 防 分 量 表 的 Cronbach’ sa 系 
数 为 0.64~0.77， 健 康 促进 分 量 表 的 Cronbach’? sa 系数 为 0.59~0.81， 内 部 一 致 
性 指标 良好 。 施 测 时 用 的 是 汉化 后 的 HLS-SF12 中 文 版 。 本 研究 中 该 量 表 在 数据 
集 1 的 Cronbach”s a=0.932， 数 据 集 2 的 Cronbach’ sa =0.933， 总 数据 集 的 
Cronbach’ s a =0.932。 


`~ 


1.23 领悟 社会 支持 量 表 


由 Zimet 等 09 开 发 、. 姜 乾 金 修订 的 领悟 社会 文 持 量 表 (Perceived Social Support 
Scale, PSSS) 分 为 家 庭 文 持 、 朋 友 文 持 和 他 人 文 持 三 个 维度 ， 每 个 维度 含 4 个 
条 目 ， 共 12 个 条 目 。 量 表 选 项 从 “ 极 不 同意 ”到 “ 极 同 意 ” 赋 分 为 1~7 分 ， 得 
分 越 高 领悟 到 的 社会 文 持 越 丰富 。 本 研究 中 该 量 表 在 数据 集 2 的 Cronbach’ sa 
=0.947， 总 数据 集 的 Cronbach”s oa =0.948。 


1.2.4 家 庭 健康 量 表 


Crandall 和 Weiss-Laxer 等 ("编制 , 用 于 测评 家 庭 健 康 功能 ， 由 王 飞 、 武 运筹 
等 0 汉化 翻译 。 该 量 表 分 4 个 维度 ， 共 10 个 条 目 。 题 项 为 “非常 不 同意 ”~“ 非 
常 同意 ” (1~5 分 ) ， 其 中 第 6、9、10 题 为 反 向 计 分 。 总 量 表 得 分 越 高 表示 家 
庭 健康 水 平 越 好 。 本 研究 中 该 量 表 在 数据 集 2 的 Cronbach's a =0.845， 总 数据 集 
的 Cronbach's a 70.846. 


1.3 统计 学 分 析 


研究 采用 SPSS 24.0、AMOS 24.0 和 R 4.2.1 进行 数据 处 理 ， 使 用 了 描述 性 统 
计 分 析 、 验 证 性 因子 分 析 、 经 典 测 量 理论 精简 条 目 、Mokken 模型 精简 条 目 、 验 
证 性 分 析 等 分 析 方 法 。 为 了 保障 简 版 量 表 的 有 效 性 ， 以 及 避免 出 现 样本 量 不 足 造 
成 的 研究 能 力 降低 的 情况 , 本 研究 对 研究 需要 的 最 低 样 本 量 进行 了 计算 091: 假设 
使 类 内 一 致 性 水 平 (ICC) 达到 0.90，I 型 错误 概率 a 为 0.05， 此 时 实现 95% 的 统 
计 功 效 需 要 223 名 被 试 。 本 研究 收集 了 7449 份 有 效 数 据 〈 包 括 条 目 筛选 和 验证 
分 析 两 份 数据 集 在 内 ) ， 说 明 样 本 量 足 以 进行 后 续 数据 分 析 。 


研究 首先 对 数据 集 1 和 数据 集 2 这 两 个 数据 集 的 社会 人 口 学 信息 进行 描述 性 
统计 ， 显 示 变 量 各 分 类 的 人 数 及 百分比 。 


通过 经 典 测量 理论 在 项 目 分 析 时 最 常用 的 四 种 方法 : 项 目 间 残 差 相 关 法 、 相 
关系 数 法 、CITC 法 、 独 立 样 本 1 检验 法 对 原 量 表 的 每 个 条 目 进行 分 析 。 项 目 间 
残 差 相关 法 计算 各 项 目 与 其 余 项 目 残 差 相 关 之 和 ,表现 为 项 目 残 差 的 MI 值 相 加 ， 
Æ MI 值 之 和 越 小 ， 残 差 对 本 维度 的 解释 越 弱 ， 条 目 本 身 对 维度 的 解释 越 强 P1。 
相关 系数 法 是 计算 各 条 目 与 量 表 总 得 分 的 皮尔 逊 相关 系数 , 选取 量 表 中 单个 条 目 
得 分 与 量 表 总 分 的 相关 系数 的 绝对 值 较 大 的 、 且 存在 显著 的 统计 意义 的 条 目 P2。 
项 目 - 总 体 相 关系 数 〈CITC) 法 根据 量 表 的 内 部 一 致 性 划 选 条 目 ， 通 过 计算 总 量 
表 或 单个 维度 的 克隆 巴赫 系数 (Cronbach's a )， 比 较 删 除 某 一 条 目 后 Cronbach's a 
的 变化 。 如 果 某 条 目 去 掉 后 总 量 表 或 单个 维度 的 a 系数 有 明显 升 高 ， 表 明 应 当 
删除 ， 因 为 该 条 目的 存在 会 降低 量 表 或 维度 的 内 部 一 致 性 ， 反 之 则 保留 忆 。 独 立 
样本 上 检验 法 首先 将 量 表 总 分 由 高 到 低 排 列 ， 高 分 组 为 总 分 最 高 的 27%， 低 分 组 
为 总 分 最 低 的 27%， 随 后 进行 独立 样本 1 检验 ， 若 结 果 显 示 高 低 分 两 组 被 试 在 某 
条 目 上 平均 得 分 不 存在 显著 性 差异 ， 则 应 当 删 除 该 条 目 P4。 


通过 项 目 反 应 理论 中 的 Mokken 模型 2 进行 分 析 。Mokken 模型 属于 非 参数 
项 目 反 应 理论 ， 与 参数 项 目 反 应 理论 相 比 ， 它 提出 更 适应 实际 情景 、 更 有 弹性 的 
框架 ， 还 更 适宜 短 量 表 使 用 R49。 利用 R 语言 的 “Mokken” 包 对 健康 素养 量 表 全 
量 表 进 行 分 析 ， 包 括 对 所 有 条 目的 单 维 性 检验 、 局 部 独立 性 检验 、 单 调 性 检验 。 
利用 自动 项 目 选 择 算 法 (Automated Item Selection Procedure, AISPO 检验 量 表单 
维 性 ，AISP 实施 时 ， 从 c=0 开始 ， 到 c=0.55 结束 ， 步 长 0.05。 当 c HRKI, 
如 果 测 验 是 单 维 的 ,可 能 会 出 现 以 下 三 个 阶段 : 绝 大 部 分 或 全 部 条 目 合 并 为 一 个 
量 表 ; 形成 一 个 容量 较 小 的 量 表 ; 形成 一 个 或 几 个 小 量 表 ， 同 时 许多 项 目 被 删除 
P27, 同时, 可 以 利用 同 质 性 系数 (homogeneity coefficients) 检 查 条 目 设 置 是 否 合 理 。 
同 质 性 系数 分 为 3 类 : I EDSIOHS). XXE (HiyRUECE(Hs)e [Rl PE ZH ERR C 
越 高 ， 测 验 所 得 总 分 对 被 试 潜在 特质 的 排序 越 准 确 ，Mokken 依据 自身 经 验 ， 认 
为 i; 必须 大 于 0，Hi; 和 HH 不 能 低 于 0.3。 更 具体 的 瑟 值 规定 为 : 当 瑞 <0.3 时 ， 
量 表 不 合格 ， 当 0.3 科 H<0.4 时 ， 量 表 的 准确 程度 较 弱 ;， 当 04-H-0.5HW[, Œ 
表 的 准确 程度 中 等 ;， 当 HO.5 时 ， 量 表 的 准确 程度 强 P8。 局 部 独立 性 检验 利用 
条 件 关 联 程序 完成 ， 由 三 个 条 件 关 联 指 数 双 下 、 允 2 、 双 3 检验， 被 标记 的 项 
目 要 逐一 删除 ， 删 除 的 原则 是 : 具有 最 多 W 标志 的 项 目 被 删除 ， 直 到 只 剩 下 没 
有 标志 的 项 目 。 如 果 项 目 具 有 相同 数量 的 标志 ， 则 同 质 性 系数 Hi 更 小 的 项 目 将 
被 删除 P9]。 最 后 ， 检 验 每 个 项 目的 单调 性 。 单 调 性 将 最 小 紊乱 系数 (#vi/#ac) 、 
显著 性 (#zsig〉 和 Crit 的 数值 作为 评价 标准 ， 当 以 上 三 个 指标 等 于 0 时， 说 明 
符合 单调 性 假设 。 但 在 实际 应 用 中 ， 最 小 紊乱 系数 小 于 0.3 可 接受 BI， 显著 性 小 
T 1.96 可 接受 B1。 当 Crit>80 时 ， 违 背 单调 性 假设 ， 当 40<Crit<80 时 ， 应 按 
照 条 目 内 容 和 量 表 使 用 目的 考虑 是 否 删除 ; 当 Crit<40 时 , 则 可 认为 该 条 目 基 本 
满足 单调 性 ， 个 别 违反 单调 性 假设 的 情况 可 以 看 作 是 被 试 抽样 误差 所 致 63。 


基于 数据 集 2 的 数据 进行 验证 性 分 析 。 在 探索 性 分 析 的 基础 上 , 对 得 到 的 简 
版 量 表 进 行 验证 性 分 析 ， 分 为 天 花 板 和 地 板 效应 检验 、 信 度 检验 和 效 度 检验 简 版 
量 表 。 地 板 和 天 花 板 效应 分 别 反映 了 得 分 最 低 和 最 高 的 参与 者 的 反应 ， 建 议 最 低 
或 最 高 水 平 的 百分比 为 15% 或 更 低 。 如 果 超 过 15% 的 受 访 者 分 别 获得 了 可 能 的 


最 低 或 最 高 分 数 ， 则 认为 存在 地 板 或 天 花 板 效应 B3l。 若 存在 天 花 板 效应 ， 则 该 量 
表 在 实际 使 用 中 , 由 于 顶端 水 平 上 选择 数量 增多 从 而 导致 后 续 数 据 分 析 中 各 指标 
的 有 效 性 受到 影响 。 地 板 效应 与 之 相反 。 信 和 度 指标 若 均 >0.7 表明 可 接受 B9。 效 
度 检 验 分 为 结构 效 度 分 析 和 实证 效 度 分 析 。 结构 效 度 检 验 中 , HLS-SF4 采用 探索 
性 因素 分 析 ，HLS-SF9 则 采用 验证 性 因素 分 析 。 然 后 通过 比较 12 条 目的 原 量 表 
和 开发 的 简 版 量 表 与 2 个 相关 概念 的 相关 性 , 进行 实证 效 度 检验 。 根 据 数据 类 型 ， 
使 用 Pearson's r 计算 相关 性 。 为 检验 简 版 量 表 与 完整 版 量 表 所 测 内 容 的 一 致 性 程 
E, 我 们 利用 RStudio 中 的 “lpSolve” 和 “irr” 包 计算 了 类 内 相关 系数 (Intra-class 
correlation coefficient, ICC) , ICC 可 以 反映 测量 之 间 的 相关 程度 和 一 致 性 。ICC 
的 评价 标准 为 : 当 ICC<0.50 时 ， 被 解释 为 一 致 性 差 ; 当 0.50 :ICC —0.74 时 ， 
被 解释 为 一 致 性 中 等 ， 当 0.75xICC x 0.90 时 ， 被 解释 为 一 致 性 好 ; ICC 二 0.90 
时 ， 被 解释 为 一 致 性 优秀 B5]。 


2 结果 


21 受 测 对 象 的 社会 人 口 学 信息 


m 


在 样本 数据 集 1 的 3680 名 受 访 者 中 ， 男 性 1608 名 (43.7%) ， 汉 族 3449 
名 (93.794) ， 常 住 城镇 者 2700 名 (73.4%) ， 农 业 户 口 1524 名 (41.4%) 。 在 
数据 集 2 的 3769 名 受 访 者 中 ， 男 性 1678 名 (44.5%) ， 汉 族 3544 Z (94%) ， 
常住 城镇 者 2170 (57.6%) ， 农 业 户 口 1599 名 (42.4%) 。 完 整 的 人 口 统计 
细节 见 表 1。 


R1 受 测 对 象 的 一 般 人 口 学 特征 


社会 人 口 学 信息 数据 集 1 数据 集 2 
人 数 百分比 (%) 人 数 百分比 (%) 

性 别 

男 1608 43.7 1678 44.5 

女 2072 56.3 2091 55.5 
民族 

汉族 3449 93.7 3544 94 

少数 民族 231 6.3 225 6 
常住 地 

城镇 2700 73.4 2749 72.9 

农村 980 26.6 1020 27.1 
户口 性 质 

非 农业 2156 58.6 2170 57.6 

农业 1524 41.4 1599 42.4 
是 否 负债 

是 1514 41.1 1553 41.2 

f 2166 58.9 2216 58.8 


家 庭 人 均 月 收入 
<3000 1113 30.2 1118 29.7 


3001-6000 1442 39.2 1476 39.2 


6001-9000 588 16 610 16.2 
z:9001 537 14.6 565 15 
年 龄 段 
<30 1333 36.2 1379 36.6 
31-45 1067 29 1100 29.2 
46-60 873 23.7 866 23 
>61 407 11.1 424 11.2 
最 高 文化 程度 
未 接受 正规 学 历 教育 /小 学 353 9.6 387 10.3 
初中 /中 专 658 17.9 654 17.4 
高 中 370 10.1 417 11.1 
大 专 /大 学 本 科 2058 55.9 2068 54.9 
硕士 研究 生 / 博 士 研 究 生 241 6.5 243 6.4 
婚姻 状况 
未 婚 1200 32.6 1239 32.9 
己 婚 2329 63.3 2330 61.8 
离异 56 1.5 95 2.5 
丧偶 95 2.6 105 2.8 
职业 状态 
学 生 812 22.1 864 22.9 
在 职 1776 48.3 1781 47.3 
退休 318 8.6 333 8.8 
无 固定 职业 774 21 791 21 


2.2 完整 版 量 表 的 心理 测量 学 检验 


基于 数据 集 1 的 数据 ,对 HLS-SF12 的 心理 测量 学 指标 进行 验证 性 因子 分 析 ， 
如 图 1 所 示 。 结 果 显 示 NFI-0.960, GFI-0.957, AGFI-0.934, CFI-0.962, 
RMSE4=0.068， 各 拟 合 指标 表明 原 量 表 模 型 拟 合 良好 。 计 算 内 部 一 致 性 系数 得 出 
Cronbach's ao=0.918， 量 表 信 度 展 好 。 
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图 1 完整 版 量 表 HLS-SF12 的 验证 性 因子 分 析 


2.3 探索 性 分 析 
2.3.1 基于 经 典 测量 理论 的 条 目 精简 


首先 ， 采 用 项 目 间 残 差 相 关 法 进行 项 目 分 析 ，MI 值 的 门槛 值 使 用 默认 值 。 
结果 显示 ， 各 维度 中 残 差 MI 值 最 大 的 条 目 分 别 为 条 目 3、 条 目 S 和 条 目 11， 说 
明 这 几 个 条 目 对 本 维度 的 解释 力 在 每 个 维度 的 所 有 条 目 中 是 最 小 的 , 故 考虑 剔除 。 

其 次 ， 采 用 相关 系数 法 进行 项 目 分 析 。 结 果 表 明 ， 完 整 版 健康 素养 量 表 与 各 
条 目 之 间 的 相关 系数 均 高 于 0.71 (y=0.716~0.797) ， 说 明 这 些 条 目 与 量 表 的 一 臻 
性 良好 ， 均 考虑 保留 。 

第 三 ， 采 用 项 目 -总 体 相 关系 数 法 (Corrected Item-Total Correlation,CITC 对 


量 表 进 行 分 析 ， 发 现 删 除 每 项 后 的 Cronbach's a 系数 在 0.924~0.928 之 间 ， 删 除 
条 目 后 内 部 一 致 性 系数 均 有 所 下 降 ， 因 此 量 表 中 没有 条 目 需要 删除 。 

最 后 , 以 健康 素养 量 表 HL 指数 最 高 的 27%(>37.5 分 ) 和 最 低 的 27%(<30.556 
分 ) 划分 高 分 组 与 低 分 组 ， 进 一 步 做 独立 样本 上 检验 ， 结 果 显 示 ， 量 表 的 高 、 低 
分 组 在 各 条 目 上 的 得 分 均 存 在 显著 性 差异 (p<0.001), 因此 量 表 中 没有 对 应 的 条 目 
需要 删除 。 

综 上 所 述 ， 运 用 四 种 经 典 测量 理论 的 方法 对 HLS-SF12 进行 精简 :结果 表明 
条 目 3、 条 目 5 和 条 目 11 在 项 目 间 残 差 相 关 法 中 考虑 删除 ， 因 此 将 这 3 个 条 目 
删除 ,形成 一 个 9 条 目的 三 维 简 版 量 表 。 基 于 经 典 测量 理论 简化 后 的 健康 素养 量 
表 (HLS-SF9) 共 包括 9 个 条 目 : 条 目 1. Z&H 2. 条目 4、 条目 6. 2&H 7. 条目 8、 
条 目 9、 条 目 10 和 条 目 12。 有 具体 条 目 分 析 结 果 如 表 2 所 示 。 


表 2 基于 经 典 测量 理论 的 5 种 条 目 分 析 方 法 结果 汇总 
"m 项 目 间 残 差 相关 相关 系 被 入 选 次 ”删除 条 


AH m 数 CITC ”极端 值 法 p 数 H 
HLSI 215.869 0.730 0.928 «0.001 4 

HLS2 129.501 0.791 | 0.925 «0.001 4 

HLS3 517.124 0.745 | 0.927 <0.001 3 " 
HLS4 230.189 0.725 | 0.927 «0.001 4 

HLS5 361.478 0.737 0.927 <0.001 3 v 
HLS6 210.054 0.760 0.926 <0.001 4 

HLS7 18.808 0.785 0.925 <0.001 4 

HLS8 123.271 0.785 0.925 <0.001 4 

HLS9 8.414 0.770 0.925 <0.001 4 
HLS10 5.270 0.797 0.924 «0.001 4 
HLS11 41.051 0.762 0.926 <0.001 3 V 
HLS12 5.978 0.716 — 0.928 «0.001 4 


2.2 基于 Mokken 模型 的 条 目 精 简 


首先 ， 对 HLS-SF12 进行 Mokken 模型 分 析 。 利 用 AISP 检验 量 表单 维 性 ， 
从 c=0 开始 ,到 c=0.55 结束 , 步 长 设置 为 0.05。 结 果 表 明 , AISP 当 c 设置 在 0~0.55 
之 间 时 ， 均 只 能 得 到 一 个 维度 ， 且 所 有 项 目 均 在 该 维度 中 。 然 后 ， 计 算 量 表 的 各 
同 质 性 系数 。 结 果 表 明 ， 本 研究 中 ，Hi 均 大 于 0.43，Hi 均 大 于 0.53, H-0.609, 
详情 见 表 3。 这 说 明 本 研究 使 用 同 质 性 系数 不 能 删除 条 目 。 

再 进行 局 部 独立 性 检验 ， 即 进行 条 件 关 联 分 析 。 第 一 轮 分 析 中 ， 指 标 W 7 
表明 第 11 项 有 6 个 标记 , 第 2 和 8 项 各 有 4 个 标记 ， 第 10 项 有 1 个 标记 ， 故 先 
将 条 目 11 删除 。 在 之 后 的 几 轮 分 析 中 ， 根 据 指标 双 7 、W'” 和 W 3 的 结果 ， 
依次 删除 条 目 8、 条 目 2、 条 目 12、 条 目 6、 条 目 9、 条 目 4、 条 目 10。 经 过 条 
件 关 联 分 析 ， 保 留 4 个 条 目 ， 分 别 是 条 目 1、 条 目 3、 条 目 $5、 条 目 7。 

随后 进行 单调 性 检验 ， 条 目 3、 条 目 4、 条 目 $、 条 目 6、 条 目 9、 条 目 11 
和 条 目 12 出 现 违反 单调 性 的 情况 ， 其 中 条 目 3 的 最 小 紊乱 系数 为 0.02， 显 著 性 
73 1, Crit 值 为 13， 考 虑 保留 条 目 4 的 最 小 紊乱 系数 为 0.03， 显著 性 为 1，Crit 


值 为 27， 考 虑 删除 。 以 此 类 推 ， 条 目 4、 条 目 6、 条 目 9、 和 条目 IL 可 以 删除 ， 详 
见 表 3。 
综 上 所 述 ， 基 于 Mokken 模型 简化 后 的 健康 素养 量 表 (HLS-SF4) 共 包括 4 个 


AH: 4 H 1 、 4 H 3, 4 H 54 4 H 7。 


表 3 基于 Mokken 模型 的 条 目 分 析 结 果 


Item H(SE) #vi/#ac #zsig Crit 
HLS1 0.571 (0.012) 0 0 0 
HLS2 0.622 (0.011) 0 0 0 
HLS3 0.630 (0.012) 0.02 1 13 
HLS4 0.593 (0.013) 0.03 1 17 
HLS5 0.611 (0.012) 0.02 1 19 
HLS6 0.605 (0.012) 0.03 1 21 
HLS7 0.618 (0.011) 0 0 0 
HLS8 0.635 (0.012) 0 0 0 
HLS9 0.610 (0.012) 0.03 1 23 
HLS10 0.629 (0.011) 0 0 0 
HLS11 0.633 (0.013) 0.03 1 29 
HLS12 0.558 (0.013) 0.02 1 25 


TE: tac 表示 进行 是 否 违反 单调 性 假设 的 检验 次 数 ;fi 表示 违反 了 单调 性 假设 的 次 数 ; #vi/#ac 表 
示 最 小 紊乱 系数 ， 也 称 违反 限度 ; # zsig 表示 违反 单调 性 的 显著 系数 


2.4 验证 性 分 析 
2.4.1 天 花 板 和 地 板 效 应 检验 
HLS-SF9 和 HLS-SF4 的 可 靠 性 可 通过 最 小 的 地 板 / 天 花 板 效 应 而 得 到 加 强 。 


X 4 显示 其 在 数据 集 2 中 的 天 花 板 和 地 板 效应 , 均 未 超过 15%, 说 明 得 分 最 低 或 
最 高 的 被 试 可 以 相互 区 分 ， 利 于 信 度 的 测量 。 


表 4 两 个 精简 版 量 表 的 HL 指数 得 分 情况 


最 小 值 最 大 值 M 士 SD 地 板 效 应 〈%) 天花板 效应 《〈%) 
HLS-SF9 0 50 35.08 士 7.96 0.2% 9.2% 
HLS-SF4 0 50 33.05 士 9.05 0.5% 10.2% 


2.4.2 信和 度 验 证 


我 们 使 用 数据 集 2 来 检验 两 个 简化 后 的 健康 素养 量 表 的 信和 度 ， 分 析 显 示 ， 
HLS-SF9 和 HLS-SF4 的 Cronbach's a 系数 为 0.913 和 0.842、 折 半 信 度 为 0.871 
和 0.815， 各 条 目 删 除 后 的 信和 度 均 小 于 等 于 0.910 和 0.810， 信 度 分 析 指 标 良 好 。 


2.4.3 效 度 检验 


2.4.3.1 结构 效 度 


在 数据 集 2 中 对 HLS-SF4 进行 Bartlett 球形 检验 和 KMO 度量 。HLS-SF4 的 
Bartlett 球 型 检验 值 为 5915.883 (p«0.012 , KMO 度量 为 0.807， 可 以 进行 因子 
分 析 。 随 后 探索 性 因素 分 析 提取 出 1 个 特征 根 大 于 1 的 因子 ， 从 CTT 的 角度 验 
证 了 其 单 维 性 ， 累 计 方 差 贡 献 率 为 67.813%， 各 条 目的 因子 载荷 量 均 大 于 0.81. 
此 外 ,其 累计 方差 贡献 率 和 各 条 目 因 子 载 答 均 高 于 原 量 表 , 对 所 测 变 量 的 解释 力 
更 强 。 

对 HLS-SF9 的 9 个 条 目 进行 验证 性 因子 分 析 〈 见 图 2) ，HLS-SF9 的 验证 
性 因子 分 析 模 型 适 配 指 标的 检验 结果 显示 CMIN/df-10.844. GFI-0.985 、 
AGFI-0.971. NFI-0.986. CFI-0.987 和 RMSEA=0.051， 除 CMIN/df 外 均 达 到 理 
想 标 准 ， 需 要 说 明 的 是 卡 方 值 与 自由 度 的 比值 (CMIN/DF) 消 除了 自由 度 的 影响 ， 
但 没有 消除 样本 容量 的 影响 ， 由 于 样本 数量 为 7449， 属 于 大 样本 ， 而 相关 研究 
表明 当 样 本 数 较 大 时 , 模型 整体 适 配 度 的 卡 方 值 就 会 随 着 样本 数 增 大 而 显著 增 大 ， 
这 时 只 需要 考虑 其 它 重要 指标 ， 而 这 个 指标 就 可 以 忽略 。 因 此 三 维 9 条 目的 
HLS-SF9 模型 拟 合 结果 较 好 。 
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图 2 HLS-SF9 验证 性 因子 分 析 模 型 
2.4.3.2 实证 效 度 


以 往 研 究 表明 ， 健 康 素养 与 领悟 社会 支持 、 家 庭 健康 均 呈 显著 相关 B6381。 我 

们 运用 数据 集 2， 将 领悟 社会 文 持 、 家 庭 健康 和 两 个 简化 版 健康 素养 量 表 同时 进 
行 相关 分 析 ， 结 果 显 示 ，HLS-SF9 和 HLS-SF4 与 领悟 社会 支持 有 显著 的 正 相 关 
(7—0.367, p«0.001;7—0.292, p<0.001), 与 家 庭 健康 有 显著 的 正 相 关 ( 产 0.340， 

p«0.001; 7-0.237, p<0.001) ， 表 明 HLS-SF9 和 HLS-SF4 的 实证 效 度 良好 。 此 


外 ， 完 整 版 健康 素养 与 领悟 社会 文 持 有 显著 的 正 相 关 (0361, p«0.00D ， 与 
家 庭 健康 有 显著 的 正 相 关 (790.329, p<0.001) ， 低 于 HLS-SF9 与 其 他 量 表 的 
相关 性 ， 说 明 HLS-SF9 的 灵敏 度 更 高 。 


表 5 健康 素养 量 表 和 两 个 简 版 量 表 针 对 其 他 量 表 的 实证 效 度 〈n=3370) 


; 健康 素养 量 表 
相关 结构 
(CTT) HLS-SF9 (Mokken) HLS-SF4 HLS-SF12 
PSSS 0.367™ 0.292™ 0.361™ 
FHS-SF 0.340™ 0.237™ 0.329™ 


ik: ** 指 p<0.001 


2.4.4 测量 内 容 一 致 性 


基于 数据 集 2， 本 研究 分 析 了 两 个 简化 版 健康 素养 的 效 标 效 度 。HLS-SF9 对 
HLS-SF12 的 效 标 效 度 的 ICC (95%CI) 730.989 (0.988, 0.999) ，HLS-SF4 效 
标 效 度 的 ICC (9594CD 730.892 (0.886, 0.8990 ， 表 明 效 标 效 度 良 好 及 以 上 ， 
即 两 个 精简 后 的 量 表 与 完整 版 量 表 所 测量 的 内 容 有 高 度 一 致 性 。 


3 讨论 
3.1 量 表 简 化 过 程 和 结果 的 合理 性 


E 


m 


HLS-SF12 运用 主 成 分 分 析 法 进行 简化 ， 在 亚洲 六 个 国家 地 区 的 验证 
果 显 示 00， 较 好 的 反映 了 HL 的 理论 结构 ， 并 在 健康 素养 水 平 亚 组 人 群 间 存 
在 有 效 差 异 ， 校 标 检 验 显示 HLS-SF12 对 亚洲 健康 素养 量 表 HLS-EU-Q47 的 
a et e a 
用 于 普 诊 、 骨 科 及 中 医科 等 科室 患者 的 研究 B9]， 以 及 在 越南 农民 、 新 冠 
i cs sm s 
良好 的 信 效 度 ， 并 且 在 跨 文 化 背景 、 地 域 差 异 以 及 社会 群体 差异 等 方面 具有 
普 适 性 ， 可 作为 应 用 多 群体 健康 素养 的 有 效 衡量 工具 。 


以 往 简化 的 研究 中 常用 经 典 测量 理论 和 Mokken 模型 这 两 个 理论 模型 。 一 方 
H, A n 发 展 时间 长 、 应 用 最 广 、 最 为 人 们 熟知 的 一 种 心理 测量 
学 理论 外]。 它 将 测验 观察 分 数 表示 为 真 分 数 和 误差 分 数 之 和 , 并 且 在 其 假设 的 基 
础 上 ， a 从 理论 上 推导 出 包括 信和 度 、 效 度 、 条 目 难 度 和 区 分 度 
等 十 几 个 参数 的 计算 公式 ， 建 立 了 完善 测验 方法 体系 ， 明 确 了 测验 标准 化 程序 ， 
使 整个 测验 过 程 更 加 客观 、 科 学 。 除 此 之 外 ，CTT 拥有 一 套 较为 易 懂 的 数学 模 
型 参数 概念 和 估计 方法 , 提倡 的 标准 化 技术 能 有 效 控制 测量 过 程 中 产生 的 误差 ， 
更 重要 的 是 ， 它 的 理论 和 方法 体系 相对 完整 ， 前 提 假 设 比 较 弱 ， 很 容易 为 实际 工 
作 所 满足 鸣 。 例 如 ， 于 斌 二 [5 等 人 采用 了 基于 经 典 测 量 理论 的 极端 值 法 、 相 关 
系数 法 和 项 目 - 总 体 相 关系 数 法 将 批判 思维 倾向 量 表 简 化 为 28 AWH, HERE 


检验 结果 显示 简化 版 量 表 可 用 性 强 。 男 一 方面 ，IRT 的 测验 模型 也 被 证 实 具有 更 
多 的 优点 , 它 采 用 非 线性 模型 , 建 六 了 被 试 对 项 目的 反应 与 其 潜在 特质 之 间 的 非 
线性 关系 ,这 一 点 更 符合 实践 领域 中 的 施 测 情况 Wl。 而 Mokken 模型 是 非 参数 项 
目 反 应 理论 模型 的 一 种 ， 具 有 非 参数 的 特性 ， 同 样 服从 IRT 的 基本 原则 ， 可 以 弥 
补 参数 项 目 反 应 理论 模型 的 不 足 。 对 所 有 项 目 进行 Mokken 模型 分 析 后 可 以 将 
不 符合 理论 假设 的 项 目 加 以 删除 或 修改 , 进一步 提高 量 表 的 质量 9， 武 运筹 、 王 
KEA ASEH Mokken 模型 分 别 简 化 了 领悟 社会 支持 量 表 和 新 的 一 般 自我 效能 
感 量 表 ， 信 效 度 民 好， 可 应 用 于 实践 领域 。 


在 简化 前 ， 我 们 使 用 验证 性 因素 分 析 对 数据 集 1 中 原 量 表 的 结构 效 度 进 
行 验证 ， 结 果 表 明 健康 素养 量 表 (HLS-SF12) 的 结构 效 度 良 好 。 在 基于 经 典 
测量 理论 的 量 表 简 化 过 程 中 ， 我 们 还 根据 五 种 常用 于 项 目 分 析 的 经 典 测 量 理 
论 的 方法 对 健康 素养 量 表 进 行 精简 ， 其 中 每 个 维度 中 有 一 个 条 目 在 项 目 间 残 
差 相 关 法 中 考虑 删除 ， 将 其 删除 后 形成 一 个 9 条 目的 简 版 量 表 CHLS-SF9) 。 


在 根据 非 参 数 项 目 反 应 理论 进行 量 表 简化 的 过 程 中 ， 我 们 对 完整 版 量 表 
进行 Mokken 分 析 。 首 先 对 完整 版 量 表 进行 分 析 ， 单 维 性 检验 表明 完整 版 量 
表 只 能 得 到 一 个 维度 ， 同 质 性 系数 良好， 但 在 局 部 独立 性 检验 中 ， 依 次 删除 
了 具有 条 件 关 联 的 8 个 条 目 ， 再 进行 单调 性 检验 ， 没 有 删除 多 余 的 项 目 ， 最 
终 得 到 了 一 个 4 条 目的 简 版 量 表 (HLS-SF4) 。 


以 经 典 测量 理论 和 Mokken 模型 为 基础 开展 简化 工作 ， 得 到 了 两 个 精简 
后 的 版 本 HLS-SF9 和 HLS-SF4, 利用 数据 集 2 的 数据 进行 天 花 板 和 地 板 效 应 
分 析 ， 结 果 表 明 两 个 效应 都 低 ， 可 以 较 好 区 分 高 低 分 被 试 ， 有 利于 进行 进 一 
步 的 信 度 分 析 。 信 度 检验 表明 ， 两 个 简 版 量 表 信 度 良 好 。 然 而 ，HLS-SFo9 的 
各 信 度 优 于 HLS-SF4 。 在 结构 效 度 检验 中 首先 进行 了 Bartlett 球形 检验 和 
KMO 度量 ， 确 定 HLS-SF4 可 以 进行 因子 分 析 ， 然 后 采用 探索 性 因素 分 析 验 
证 HLS-SF4 的 简化 的 结构 , 经 过 主 成 分 分 析 提 取出 一 个 特征 根 大 于 1 的 公 因 
F, ARIA Mokken 模型 分 析 中 AISP 所 检验 的 量 表 单 维 结构 的 前 提 假 设 ; 
对 HLS-SF9 则 采用 验证 性 因素 分 析 , 结果 显示 其 三 维 模型 的 各 项 适 配 指标 均 
为 优秀 , 说 明 9 条 目的 简 版 量 表 被 划分 为 三 个 维度 是 合理 的 ,值得 一 提 的 是 ， 
两 个 简 版 量 表 是 采用 两 种 不 同 的 结构 效 度 验 证 方式 检验 量 表 结 构 ， 这 有 两 个 
原因 : 一 是 利用 经 典 测量 理论 简化 条 目 时 ， 并 未 涉及 到 维度 的 增 减 ， 维 度 确 
定 且 与 原 量 表 保 持 一 致 ， 二 是 利用 Mokken 模型 简化 条 目 时 ， 打 破 了 原 有 的 
维度 ， 合 并 成 单一 维度 ， 且 简化 后 保留 的 条 目 只 涉及 前 两 个 维度 。 实 证 效 度 
检验 的 结果 显示 ，HLS-SF9 与 其 他 量 表 的 相关 性 高 于 原 量 表 以 及 HLS-SF4 
与 其 他 量 表 的 相关 性 , 说 明 HLS-SF9 的 灵敏 度 更 高 。 测量 两 个 精简 后 的 量 表 
与 完整 版 量 表 的 ICC 指数 ， 结 果 表 明 所 要 测量 的 内 容 有 高 度 一 致 性 ， 但 
HLS-SF9 高 于 HLS-SF4。 综 上 所 述 ，HLS-SF9 条 目 保留 原 量 表 因子 结构 ， 信 
度 、 灵 敏 度 更 优 ， 和 原 量 表 的 测量 内 容 一 致 性 更 高 ， 而 HLS-SF4 条目 少 ,各 
项 因子 载荷 量 更 高 ， 因 此 保留 两 个 精简 版 本 均 具 有 合理 性 。 


-> 


v— 


在 传染 性 或 非 传染 性 疾病 的 预防 与 控制 中 , 健康 素养 是 不 容 忽视 的 重要 因素 ， 
比如 在 新 型 冠状 肺炎 的 信息 疫情 中 ,健康 素养 成 为 公众 辨识 “谣言 ”的 关键 工具 
501。 本 研究 使 用 全 国 范围 的 大 样本 研究 数据 ， 尽 可 能 降低 地 域 差异 带 来 的 侦 倚 ， 
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以 提高 研究 的 可 推广 性 号， 并 将 数据 随机 生成 两 个 样本 群 ， 相 互 验证 研究 结果 。 
精简 后 的 健康 素养 量 表 条 目 相 较 于 国内 的 常用 的 评估 问卷 , 条 目 数量 少 、 作 答 时 
间 短 、 作 答 难 度 较 低 ， 更 适宜 测评 全 年 龄 段 人 群 亦 或 在 综合 性 问卷 中 使 用 。 


32 局 限 及 未 来 研究 


本 研究 分 别 采用 两 种 理论 为 基础 ， 皆 严格 遵守 了 量 表 简 化 的 理论 原则 , 但 仍 
存在 一 定局 限 性 。 例如 本 研究 选择 全 国 大 样本 横 截 面 研究 为 数据 来 源 ， 未 来 需要 
在 纵向 研究 中 ,做 简化 版 量 表 的 有 效 性 与 稳定 性 验证 工作 ; 在 多 领域 实际 运用 中 ， 
也 需要 更 多 的 适应 性 验证 与 调整 。 


4 结论 


本 研究 运用 经 典 测量 理论 以 及 Mokken 模型 筛选 HLS-SF12 条 目 ,经 过 简 
化 的 9 条 目 与 4 条 目的 健康 素养 量 表 , 在 我 国 公众 群体 中 具有 良好 的 信 效 度 ， 可 
以 作为 测评 我 国 全 人 和 群 健康 素养 的 可 靠 且 精简 的 工具 。 
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